在对光学相干断层扫描(OCT)数据进行深度学习的应用时,通常是使用源自体积数据的2D图像训练分类网络。鉴于OCT系统的千分尺分辨率,在可见的结构和噪声中,连续图像通常非常相似。因此,不适当的数据拆分可能会导致训练和测试集之间的重叠,其中很大一部分文献忽略了这一方面。在这项研究中,使用三个OCT开放式访问数据集,Kermany's和Srinivasan的Ophthalmology数据集以及AIIMS乳房组织数据集证明了三个分类任务的数据集对模型评估的影响。结果表明,分类性能在MATTHEWS相关系数(准确性:5%至30%)方面膨胀了0.07,对于在数据集中测试的模型不当,突出了数据集处理对模型评估的相当大影响。这项研究旨在提高人们对数据集分裂的重要性的认识,因为在对OCT数据上实施深度学习方面的研究兴趣增加。
translated by 谷歌翻译